查看原文
其他

精华帖 | Handbook of Functional MRI Data Analysis翻译第二章

2017-03-13 Ty等 我爱脑科学网

作者按:

Handbook of Functional MRI Data Analysis 的 翻译计划,完成了第2章的翻译。感谢各位滴友的翻译和校对工作。同时也欢迎大家找bug,讨论内容,以及提意见。请尊重网友们的劳动成果,转载请注明出处。

分析fMRI数据的过程中,有很多操作都涉及到图像转换。在本章中,我们将对图像的基本处理做一个简要的概述,这些操作在fMRI数据分析过程中是十分重要的。


2.1 什么是图像?

从最微观的层面看,数字图像其实是一个数字矩阵,其中每个数字都对应一个空间位置。当查看图像时,我们可以通过一些数字表示图像的灰度值(常见于MRI解剖图像,如图2.1)或颜色值(常见于统计参数图)。通常,我们将图像中的每个元素称为"体素"voxel),用它来模拟一个三维的像素。当我们处理图像时,实际上就是在对矩阵进行一些数学运算。例如,我们可以通过增加矩阵中的数值使一张图像变得更亮(即更白)。

在计算机中,我们常用二进制数据来表征图像,也就是说表示图像所用到的数字并不是我们所熟悉的在纯文本或电子表格等格式中所用到的数字,而是一种由10两个数组成的数字。不要小看10,它们可以组合成大量不同的数字,我们在Box2.1中对此进行了更详尽的说明。

2.1 以矩阵形式显示的图像:左侧图像中的灰度值对应于右侧一组体素所显示的数值。

数值格式

 用数字表示图像存在一个不容忽视的问题:如果数字表达方式不恰当,将会损失掉图像的一部分信息。例如,假设我们所收集到的原始MRI图像是用整数值100010000来表示的,现在我们进一步将每个体素的数值都除以100,就会得到一个新的图像,它的数值范围是10100。如果这个新的图像是以浮点数值形式被存储的,那么原始图像中的信息就会被完好的保留下来,即原始图像中存在9000个不同的数值,而在新的图像中还会存在9000个不同的数值(例如,3280变为32.8,以此类推)。但是,如果新的图像依然是以整数值形式被存储的,那么就会损失一部分信息:原始图像中的9000个数值经过转换后仅剩下了90个,也就是说,在新图像中接近于整数值的那部分信息就被丢失了。而使用浮点数值的代价则是图像文件将会较为庞大(详见Box2.1)。

Box 2.1 数字图像呈现

组成图像的数值既可以是整数型变量也可以是浮点型变量。在数字计算机中,通常会依据信息量来标定数值,信息量的单位是比特(bits),一个二进制值(true/false1/0)所包含的信息量就是一个比特。不同位数的数值,它们的取值范围是不同的。例如,一个一位变量有两个可取的数值(10),而一个二位变量则有四个可取的数值(00011011)等等。也就是说,一个具有n位的变量可以取2^n个不同的数值。MRI的原始数据一般被存储为16位非负数值,即数值的取值范围为0655352^16-1)的整数;分析所得到的结果(如统计图)则一般被存储为32位(单精度:最多7位十进制有效数字)或64位(双精度:最多14位十进制有效数字)的浮点数值。这些数值被称为浮点是因为其小数点的位置是可以移动的,相比定点数能够表示更大范围的数值。

存储图像的数值位数决定了其所表示信息的精度。有的时候,受制于产生数据的程序,数据的精度是有限的,比如说MRI的原始数据就是这样的,在这种情况下更为精确的数据会占用更多的存储空间,且不会对结果产生影响。但是,当我们开始处理这些数据时,可能就会希望数据的精度更高,这样才能避免数值取整时所产生的误差(即量化误差)。解决这个问题的办法很简单,如果我们需要精度更高的数据,那就准备出更多的存储空间。例如,当一个标准的MRI图像(64×64×32体素)以16位整数值存储时,仅需要256千字节的磁盘空间,而当它以64位浮点值存储时则需要1024千字节(一兆字节)的磁盘空间。

元数据

除了每个体素的数值之外,计算机也会存储另外一些有关图像的信息,通常称之为元数据”(metadata)。这些数据一般会被保存在一个头文件(header)中,既可以作为一个单独的文件,也可以作为图像文件的一部分,常见的存储格式有AnalyzeNIfTIDICOM等。了解上述文件存储格式的细节是十分重要的,但由于这一话题偏离了本章的主题,故不在此处赘述,感兴趣的读者可以翻阅附录C

储存时间序列数据

MRI的结构像一般是由三维的图像所组成,而fMRI数据则在此基础上包含了时间序列信息。例如,我们可能会在6分钟内每2秒钟收集一个图像,那么就可以得到180个三维图像的时间序列。一些文件格式可以表示四维的数据集,即将时间作为第四个维度,把所有的时间序列连同其它维度的信息保存在同一数据文件中;也有一些文件格式则需要将时间序列作为单独的文件,即将时间序列保存在三维数据文件之外的文件中。

2.2 坐标系

由于MRI图像所反映的是物理对象,所以我们需要通过一些方法,将图像中的数据点对应到物理对象的空间位置上。坐标系(coordinatesystem)能够帮助我们实现上述需求,通过它可以确定一个图像的空间属性。一个大脑图像的数字矩阵通常是三维的,数据矩阵的每个维度都对应着空间中的一个维度。依照惯例,这些维度(或坐标轴)被称为XYZ。在用于神经成像数据的标准空间(在章节4.3中有更详尽的介绍)中,X代表左/右;Y代表前/后;Z代表上/(见图2.2)在数据矩阵中,一个特定的体素可以被标记为[Xvox,Yvox, Zvox], 通过这三个维度的坐标就可以确定体素的位置了(数值从0还是从1开始取决于不同软件系统的设置)。关于这些数据具体是如何被存储的信息(如,X的第一个数值是代表最左边的体素还是代表最右边的体素)一般会被保存在图像的头文件中,对图像元数据感兴趣的读者可以翻阅附录C

2.2 基于MRI标准坐标空间的三个主要坐标轴示意图(注:从MRI扫描仪直接获取的图像的坐标轴的方向可能会与此图不同)。

2.2.1 放射学和神经学的惯例

不同的科研领域都会有它们自己的数据呈现惯例,所谓惯例就是说这些规则往往是约定俗成的:例如,在电生理研究中,绘制出的事件相关电位波形通常是负电压向上、正电压向下的。由于放射学家与神经学家各自的偏好和习惯,他们在存储和呈现人脑图像时也有各自不同的一套惯例:放射学家在绘制图像时会将右脑绘制在图像的左侧,也许是因为这样图像中脑结构的方向恰好与从床脚一侧看到的身体方向相匹配。基于此,这种左右倒置的图像呈现方式被称为"放射学惯例"。相反,神经学家在绘制图像时则不会进行左右倒置(即他们会直接将左脑绘制在图像的左侧),这种呈现方式被称为"神经学惯例"。不幸的是,到目前为止并不存在一套统一的人脑图像存储和呈现惯例,所以研究者在查看图像总是需要留意X轴的方向问题。由于人脑的左右对称性,研究者很难找到一种稳妥、有效的方法直接区分出图像中哪一侧是左脑、哪一侧是右脑。从解剖学的角度讲,大脑两半球的差异是很小的,加之个体之间存在差异,所以的确是很难在图像中区分出左、右脑。相较而言,判断前/后、上/下两个维度则要容易许多,无需考虑什么惯例,仅通过解剖上的特点就可以明确的分辨出哪个方向是前/后或上/下。

2.2.2 标准坐标空间

前文中已经提到,坐标系能够将脑的物理结构与图像的坐标联系起来。我们将从MRI扫描仪中所获取的图像的原始坐标系叫做图像的(native space),尽管我们可以通过原生空间将图像的坐标与物理结构联系起来,但是当涉及不同个体的人脑结构(或是涉及同一个体在不同时间段中扫描获得的结果)时,原生空间就不能将这些结构很好的排列起来了:每个人脑都有不同的尺寸,即使是同一个人,当我们多次扫描他的脑,脑在图像中的位置也会随着脑在扫描仪中位置的改变而发生改变。在神经成像的研究中,许多研究题目都需要合并不同个体的数据,所以我们就需要一种能够将不同个体的物理结构对齐的通用空间。神经外科医生最早推动了这种通用空间的发展,因为在他们的立体定位神经外科手术中亟需一种标准化的空间。现在我们一般将这种空间称为标准空间(standard spaces)或立体定位空间(stereotactic spaces),其中最著名的生成标准空间的方法是由Jean Talairach(Talairach, 1967)发展出来的。最近,加拿大蒙特利尔神经病学研究所(Montreal NeurologcialInstitute, MNI)基于大量的MRI图像数据发展出一种立体定位的坐标空间,并逐渐成为神经成像研究领域的标准空间。我们将在第四章中对标准坐标空间这一问题做进一步的讨论。

2.3 空间变换

fMRI数据分析中常常需要图像的空间转换,例如,配准个体(也可能是头动校正)或者个体间的图像(为了组分析)。

图像变换的方法有很多种。一个简单的变换(参数很少)可能把图像在空间中移动而不改变它的形状,一个复杂的变换可能需要把两个复杂的结构进行配准。通常来说,我们会关注与体素的数目相比,参数相对较少的方法。我们也会关注那些迄今为止最常用的自动配准的方法——不需要手动划定解剖标志。在这一章,我们仅仅讨论基于体素的变换,包括变换成一个三维的体数据。在第四章中的空间标准化,我们还会讨论基于表面的方法,包括利用表面(比如皮层表面)而不是立体结构进行空间数据转换。

图像配准有两个必要的步骤。首先,为了最好的配准效果,我们需要评估变换参数。这需要我们有一个指定的变换模型,其中图像在配准过程中可以改变的。模型中的每个参数表示图像中的一个变化。一个很简单的模型可能只包括几个参数,比如一个模型只对两幅图像做一个总变换而不去配准它们之间的细节。一个复杂的模型包含更多的参数并把图像配准的更好,特别是它们的细节。我们还需要一个衡量配准程度的方法,也就是成本函数(cost function)。我们要找到成本函数最小时的参数,这就保证了两幅图像之间的最佳配准(详见2.3.2)。

一旦我们确定了变换模型的参数,我们必须对原图像做重采样从而得到配准后的图像。每个体素的原坐标也变换到新的空间,而且基于这些转换后的坐标新图像得以建立。由于转换后的坐标一般不会准确地落在原始图像的坐标上,因此有必要去计算中间点的强度值,亦即我们所知的插值(interpolation)。插值法的具体方法多种多样,从简单的(如选择最近的原图像体素)到复杂的整个图像的加权平均值等等。

 

2.3.1 变换模型

2.3.1.1仿射变换

fMRI中最简单变换模型包括利用线性算子,也就是仿射变换。仿射变换的一个特点是,变换前线上的点在变换后仍然落在这条线上。因此,仿射变换不会改变作用对象的形状(比如弯曲)。

仿射变换包括以下线性变换的组合:

平移

旋转

拉伸(缩放)

错切

图2.3是这些仿射变换的示意图。对于一个三维图像,每个算子可以作用于每个维度,并用一个单独的参数表示。这样,一个完整的仿射变换的图像转换,旋转,倾斜,并在三维空间中沿每个轴的延伸可以由12个参数描述。

有时你只想用这些线性变换中的一部分来完成图像变换,也就是用少于12个参数来完成仿射变换。比如,在头动校正中,我们假设头在运动的过程中没有大小和形状上的改变。我们可以用6个参数(三个平移三个旋转)的仿射变换对这些图像进行重新校正。由于图像中物体的形状和大小没有变化,所以这也叫做刚性变换。

图2.3. 线性变换。在每张图中,黑色的点代表原始坐标,蓝色的点代表经过变换后的新坐标

 

2.3.1.2分段线性变换

仿射变换的扩展之一就是把整个图像分成几个部分,并允许在每个部分的不同的线性变换。这就是分段线性变换。分段线性变换曾应用于Jean Talairach发明的早期的大脑图像空间标准化方法中。(在第四章会详细说明)

2.3.1.3非线性变换

相比于仿射变换,非线性变换给予了图像配准更大的灵活性,比如不同的图像可以匹配的更精确。非线性变换技术非常广泛,此处我们仅作一个简单介绍。;更多的细节参见Ashburner&Friston (2007)和Holden (2008)。虽然仿射变换仅局限于体素坐标的线性算子,但是非线性变换可以使用各种算子。非线性变换常常被描述成基函数,这些函数可以用于原坐标的变换。前文提到的仿射变换亦是基函数的一种。然而,基函数的扩展可以使我们在更高的维度上重新表示坐标,方便使用更复杂的变换。

例如,一个多项式的基本展开涉及原始坐标的多项式函数。一个二阶的多项式展开则包含了原坐标(X/Y/Z)二次项以内的所有可能组合。

这里Xt/Yt/Zt是变换后的坐标,展开项有30个参数(a1...a10,b1...b10,c1...c10)。所有展开的顺序都是可能的,随着展开顺序的增加,参数的数量迅速增加;比如,一个12种排列的多项式在三维空间中有1365个参数。

另一个fMRI数据分析中常用的非线性基函数集是离散余弦变换(DCT)基函数集,这曾经在SPM中使用(Ashburner&Friston,1999),尽管最近已经被样条基函数取代。这个基函数集包含从低频到高频的余弦函数(在图像中变化的很缓慢)。这跟傅立叶变换很接近,这在2.4中会详细讨论。每个余弦函数都有一个与之相关的参数;低频的部分反映全局变化,而高频的更多的反映了局部的变化。

特别的,高维变化允许更多的局部变化,而线性变换则必须以一种等价的方式影响整个图像。相比于其他转换方式,非线性转换可以更加彻底的改变图形的某些部分。

Box2.3.1数学中的仿射变换

仿射变换包括图像坐标的线性变换,可表示成:

这里Ctran是变换后的坐标,Corig是原坐标,T是变换矩阵。为了更方便的矩阵运算,坐标常被表示成齐次坐标,即把N维的坐标嵌入到N+1维的线性空间中去。这只是为了更简单的表示上述坐标变换而采用的一个数学上的技巧齐次化之后就可以把非齐次的仿射变换,形式上写成齐次的变换)。简单起见,我们在这里给出一个完成上述变换的二维坐标的例子(即上述N=2)

这里Cx和Cy是在X轴和Y轴上面的坐标。有了这些坐标,每种变换可以定义如下:

沿着X轴(Transx)和Y轴(Transy)的变换

在平面中旋转(旋转角theta)

沿着X轴(Scalex)和Y轴(Scaley)缩放

沿着X轴(Shearx)和Y轴(Sheary)错切

2.3.2成本函数

为了评估哪几个参数可以让两幅图像达到最优配准,我们需要一个定义图像之间差别的方法,这就是成本函数。一个好的成本函数在图像配准的很好的时候应该很小,在配准很差的时候应该很大。成本函数的选择决定于要配准的图像的类型。如果图像都是相同类型的(比如配准不同时间点的fMRI图像),罚函数仅仅用于判断两个图像灰度值的相似度。如果图像匹配的很好,那么图像上相同像素点的灰度值应该十分接近(就目前而言,我们不考虑由于激活导致的变化)这个问题通常指“模式内”匹配。从另一方面说,如果图像有不同类型的对比度(比如,一个T1加权像和一个T2加权像),最优的匹配不是由图像之间相似的灰度值决定的。这就是“模式间”匹配。对于T1加权像和T2加权像而言,T1加权像中的白质比灰质更亮一些,而T2加权像刚好相反(图2.4),这样我们就不能简单的通过图像的灰度值进行配准了。取而代之,我们想用一种对不同体素集的相对强度敏感的方法;比如,我们可能想把一幅图像中亮的部分和另一幅图像中暗的部分相匹配。

这里我们描述了集中最常用于MRI图像配准的“模式内”和“模式间”罚函数。

图2.4. 不同类型的MRI图像。随着图像类型的不同,不同脑区(比如白质、灰质、脑脊液)的相对灰度值也不同。这就意味着不能简单的通过图像的灰度值来完成配准。

 

2.3.2.1最小二乘法

最小二乘罚函数可能是最为大家熟悉的,因为它是最标准的统计方法的基础。这种罚函数测量两个图像相同体素之间差值的平方和

这里Av和Bv指图像A和图像B中第v个体素的信号强度。由于这种方法测量的是每个体素数值之间的相似程度,所以最小二乘成本函数仅适用于“模式内”的图像匹配。即使是“模式内”的图像,由于两个图像的信号强度分布不同,最小二乘法成本函数也可能表现的很糟糕(比如一幅图像更亮一些或者信号强度分布更广)。AIR软件包中的一种方法是第一个在用最小二乘法成本函数之前得到信号强度分布的,所以他们先把图像的信号强度分布调成一致。

 

2.3.2.2归一化互相关法

归一化互相关就是衡量两幅图像之间的体素信号强度的线性关系。定义是:

这种衡量方法仅适用于“模式内”的配准。在多种不同的罚函数运动校正方法中,Jenkinson等(2002)发现归一化互相关法比包括最小二乘法在内的其他方法得到的配准结果更精确。这也是FSL软件包中运动校正的默认罚函数。

2.3.2.3互信息法

鉴于之前提到的用于“模式内”配准的成本函数是以经典的统计学作为基础的,互信息成本函数(Pluim等,2003)(可用于“模式内”和“模式外”配准)则是以信息论中“熵”的概念作为出发点的。熵指的是对一个信号不确定性或者随机性的量度。

这里pi是变量中每个可能的xi发生的概率;对于连续变量,数值被分为N组,也就是直方图。熵测量一个信号不同可能的值发生的程度。如果信号只有一个取值(比如对于一个xi,pi=1,对于其他xi,pi=0),那么,熵取最小值。如果每个不同的数值等概率发生(比如对于所有的xi, pi=1/N),那么熵取最大值。利用这种方法,拉近了熵与信号变化之间的关系,以及预测信号中下一个值的不确定性的可能。通过检验图像的联合直方图----刻画图像中所有体素所有可能的灰度值组合的频率(图2.5),熵可以用于多幅图像中。如果两幅图像是相同的,那么联合直方图仅仅在对角线上有取值(因为每幅图像每个体素的取值都是相同的),鉴于图像之间的不同会导致直方图上的数值更分散;在“模式内”情况中,相关性成本函数比互信息(MI)成本函数更合适。对于不同模式的图像,互信息成本函数更实用,配准的越差,联合直方图越分散(图2.6)。图A和图B的联合熵可以通过这个连个直方图计算出来

这里i代表A的取值,j代表B的取值,pi,j =P(A=Ai&B=Bj)。当图像B的值可以完美预测图像A中相同的体素时,取值最小。

互信息是每个图像总熵之间的不同,联合熵是指:

其中H(A)和H(B)是每个图像的熵(边际熵),H(A,B)是指联合熵。当联合熵最小时,互信息取最大值,也就是说一幅图像的值可以由另一幅图像最大程度的预测出来。因此,互信息就成为衡量两幅图像的相似程度的有力工具。

    在某些情况下,当图像之间的重合减少时,互信息会增大,这也是互信息存在的一潜在的问题。出于这种原因,建议使用互信息的归----化系数(Studholmeetal.,1999):

    所有的主流软件包(FSL, SPM和AFNI)在图像配准中都提供常规和归一化的成本函数。


图2.5. T1加权图像和T2加权图像的联合直方图。图像中黑色的部分代表直方图中的高频部分。红色箭头代表两幅图像中不同体素的灰度值,上面的箭头是灰质部分,下面的箭头是白质部分。


图2.6. 图2.5中的T1加权图和T2加权图的联合直方图;左图是原始配准图像的联合直方图。中图是其中一幅图像旋转1度后的联合直方图;右图是其中一幅图像旋转180度后的联合直方图。每张直方图上标注了MI值,随着图像相似度的降低,MI值降低。

2.3.2.4相关性比值

    相关性比值度量了一种度量下的方差被另一个度量下的方差capture的程度有多好。图A和图B的相关性比值定义为

这里k是图像B中每个独立的值,N是图像B中独立值的个数。如果图A和图B是相同的,那么图B中有一些特殊取值的体素与图A中的取值没有差别,那么相关性比值就是0。这种测量方法与Woods第一次在AIR软件包中的PET-MRI配准标准相类似(Woods等, 1993),尽管在某些情况可能有不同(Jenkinson&Smith,2001)。这种方法适用于“模式内”和“模式间”的配准,同时也是FSL软件包中的默认的“模式间”成本函数。

 

 

2.3.3转换参数计算

要对齐两个图像,你必须确定哪一组转换模型的参数生成的成本函数的值最小。通常情况下无法通过分析性的方法来确定最佳的参数,因此必须得采用最优化方法来估计这些参数。尽管有大量关于优化方法的文献资料,但由于功能磁共振成像研究人员很少直接使用这些方法,我们不会在这里详细描述他们。更多详细信息,感兴趣的读者可以参阅Press(2007)。在这里,我们将重点描述与优化相关的问题,因为这对理解图像配准非常重要。

图像配准的优化方法尝试寻找特定的能够最小化图像配准的成本函数的参数值。最简单的方法是穷举搜索每个参数的所有可能值的所有组合和选择能够最小化成本函数的组合。不幸的是,这种方法在计算上是不可行除非是极少参数的最简单的问题。因此,我们必须使用一种能够穷尽搜索参数空间以减少成本函数的方法。一类常见的方法就是所谓的梯度下降法,其中的参数设置为特定的起始值,然后该值以最好降低成本函数的方式被修改。这些方法都非常强大并能迅速解决优化问题,但很容易受到局部极小值的影响。当参数的数目比较大时,这一问题就会变得尤为明显。多维"成本函数空间"有很多无法解决的局部问题,在这种情况下优化方法失效了以致只能用一种次优的解决方案。在优化研究的文献中,有许多方法来解决局部极小问题。在这里,我们只讨论其中的两个已经在正则化和多尺度优化的神经影像学文献中使用的方法。

2.3.3.1 正则化

正则化通常是指对参数的特定值的估计有局限的方法。在空间标准化的过程中,Ashburner,和Friston及其同事开发出一种方法(应用于SPM中),这种方法在更加复杂的扭曲的情况下会导致更大信息损失,其中复杂性是通过弯曲能量的概念来量化的(Ashburner& Friston1999)。这意味着,扭曲越复杂越需要支持的证据。当使用非线性的没有正则化的配准工具(如AIRSPM的旧版本)时,经常会发现解剖上不合理的非常大的局部扭曲(见图2.7)。采用正则化能够避免不合理的扭曲但同时也会存在因少量的高维扭曲导致的相对精细的变化。


2.7正规化对非线性配准影响的示例。上面的四个图像是在SPM5 中配准一个高分辨率结构图像到 T1 加权模板生成的。最左边的图像是只使用仿射变换,其他三副图像使用不同的正规化水平(正规化参数分别为10010)进行非线性配准。最右边的图像提供解剖学上不可行的扭曲的示例,这是由于采用了无正则化的非线性配准。尽管这些扭曲在解剖学上不可行,但是这确实会发生在高分辨率图像与模板的配准过程中。

 

2.3.3.2 多尺度优化

多尺度优化法是出于在合理的时间内搜索大的参数值集(以避免局部极小值)的需要。其基本理念是先估算相对低分辨率图像(这主要依赖于大脑中的大的结构)的参数,在大的结构对齐的基础上,然后再进行高分辨图像的参数估计。例如,在FSL中配准最开始就是在8毫米的分辨率上进行。因为旋转参数的估计是最困难的,所以在低分辨的图像上进行遍历搜索来估计旋转参数。一旦确定了旋转参数,优化估计就在更加精细的尺度上进行(如,图2.8),每进行一步就估计更多的参数,直到在最精细(1毫米)的水平上估计出所有的12个仿射变换的参数。这种方法可以避免局部极小值,而如果在一个分辨水平上进行优化就会产生局部极小值(Jenkinson& Smith, 2001)

2.8 示例,同一幅图像在不同的分辨率时在FSL中进行多尺度优化的结果。

2.3.4重采样和插值

在确定好标准化转换的参数之后,就能够对原始图像进行转换和重采样。这需要根据转换的坐标体系上图像的原始密度对坐标空间中的每个体素进行值的填充操作。如果是图像转换后的位置与原图像中的位置完全重叠的有限转换,那么就可以简单地把相应地被转换体素中值填充到坐标空间中的相应体素中。然而,转换通常都会涉及到小于1个体素的转换。例如,在运动校正中运动的校正通常不到体素大小的1 /10。在这种情况下,变换后的体素与原体素不完全重叠,因此为了得到重采样的图像就需要对原始图像进行密度插值。

2.3.4.1 最近邻域插值法

在最近邻域插值法中,新体素的值由原始图像中与其最接近体素的值所取代。这种插值方法很少采用,因为它存在很多的问题。首先,这种会导致重采样的图像看起来像块状和图像分辨率的降低。当对同一幅图像进行多次插值时,上述现象就尤为明显,就如图2.9中所示。其次,使用最近邻域插值时,转换参数的连续变化可能会导致成本函数值的不连续变化,这使得其不适合用于作为优化方法(优化方法通常假定成本函数是连续的)。

2.9 关于重复插值效果的极端例子。每幅图像以0.01弧度旋转六次,在每一步骤中分别使用最近邻域、三重线性和正弦插值法进行重采样。与正弦插值的结果相比,最近邻域插值产生了伪影而三重线性插值的结果更加模糊。

最近邻域插值法只在一种情况下是首选,这就是当体素的值代表是分类标签而不是物理强度。例如,在一些图像处理软件工具箱中自带的大脑解剖图就是数值型的图像(特指fmri.img文件等),只不过这些数值是根据不同的大脑结构任意指定的分类数值(如,海马的所有体素的值都设为12,杏仁核的所有体素的值都设为20)。如果采用平均插值法会生成无意义的结果,而采用平均邻域插值法就可以确保转换图像中标签的值保持与原始图像中的值一致。

2.3.4.2 线性插值

线性插值法通常是指应用于三维空间的三重线性插值法,具体做法是对每个点计算其原始图像中最近邻域点的加权平均值。图2.10就是线性插值的示例。与高阶插值法相比,线性插值法的优点是计算快,因为这种方法只需要考虑那些与新的体素直接相邻的体素的值。然而,与高阶插值法(如,正弦插值法)相比,线性插值法往往会造成图像更加模糊。

图2.10 线性插值法示例。A,B,C和D是2毫米间距的网格上的四个原始点。 G点是B点沿X轴向左平移0.75mm和沿Y轴向下平移后的结果。要确定G点的图像密度,就必须在x轴或y轴做密度插值。在本例中,我们沿着x轴进行插值就找了E和F两个点(的密度),然后再沿着Y轴做插值来确定G点的密度。

2.3.4.3 高阶插值

许多插值方法已被开发出来,这些方法比最近邻域插值法(只使用最近邻域体素的值)和线性插值法(使用三维空间中最近的8个点的值)能够反映更多体素的信息。使用最广泛的高阶插值法就是正弦插值法,其公式为sinc(x)= sin(x)/x(图2.11)。正弦插值法从原理上讲需要用到图像中每个体素的信息,因为该正弦函数延伸到无限远。然而,这种插值方法的计算非常费时。采用正弦窗函数能够使正弦插值法更加可行,因为这只需要从插值点延伸到有限范围而不需要包括整个图像。其它窗函数也是可以采用,常用的是汉宁窗(Hanning window)函数和矩形窗(rectangular windows)函数。相对于矩形窗函数,汉宁窗函数(Hanning window)的插值错误会小一些(Ostuniet al., 1997),因此,在条件允许的情况下,应该采用半径至少为4个体素的汉宁窗函数。

另一种形式的高阶插值将基本函数用于空间转换模型,如2.3.1,节中所述。类似B样条基函数的基本函数是一种更加全面的插值方法,它包含最近邻域插值、线性插值和高阶非线性插值。这些方法的详细论述超出了本书的范围,感兴趣的读者可以阅读Thevenazet al.(2000 )Ostuni et al.(1997 )

2.11 正弦函数示例。 X轴的刻度表示原始图像中采样点的位置,其中0点代表需要插值的点。要计算插值点的值,需要对原始的图像的坐标网格中每一点进行正弦函数的计算(其中数值表示是图像的信号强度)。这样插值点的值就是所有的正弦函数在该位置的值之和。(这相当于图像的正弦函数卷积)。


本章翻译:Ty,wangyesmile,tangnuo,fingertip

本章校对:小宇哥,盖聂

本期编辑:陈锐


本文为论坛滴友翻译帖,若有疑问,请后台留言!


52brain,Connect Young Brains.

预知更多翻译章节,敬请关注后续文章。


--52brain我爱脑科学网﹣﹣

专业、分享、真诚、民主



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存